Another Datum领域信息情报检索

我叫Yoel Zeldes,我是Taboola的算法工程师。我在耶路撒冷希伯来大学完成了计算机科学的硕士和学士学位。我通过参与与网络安全、计算机视觉、机器学习、网络、移动和分布式计算相关的项目谋生。在这里,您将找到有关数据科学和软件工程的资源。

CTR 预测的不确定性:一个模型来澄清所有问题

Uncertainty for CTR Prediction: One Model to Clarify Them All

了解如何使用一个统一模型以原则性的方式处理推荐系统中的不确定性。

GPT-2 的可访问性 - 文本生成和微调

The Accessibility of GPT-2 - Text Generation and Fine-tuning

使用正确的工具,使用 GPT-2 生成文本非常简单。了解如何操作,以及如何在自己的数据集上微调模型。

使用不确定性来解释您的模型

Using Uncertainty to Interpret your Model

解释深度学习模型很难。了解如何使用不确定性估计来了解模型学到了什么。

TensorFlow — 软件工程的范围

TensorFlow — The Scope of Software Engineering

如何像软件工程师一样构建 TensorFlow 图。

Pelican 和 GitHub Pages 工作流程

Pelican and GitHub Pages workflow

使用 Pelican 和 GitHub Pages 撰写博客文章的简单工作流程。

推荐系统:使用不确定性探索未知领域

Recommender Systems: Exploring the Unknown Using Uncertainty

了解探索-利用权衡是什么,以及如何使用模型的不确定性以明智的方式探索新项目。

用于信息融合的门控多模态单元

Gated Multimodal Units for Information Fusion

了解如何使用 GMU 块训练神经网络以使用来自多种不同模态的输入。

GPT-3,深度学习和 NLP 的一大步

GPT-3, a Giant Step for Deep Learning and NLP

仅通过使用大量数据训练足够大的语言模型就能产生智能吗?OpenAI 尝试使用 1750 亿个参数来实现这一点。

以不同的方式思考您的数据

Think your Data Different

了解 node2vec 的工作原理,以及它捕获了 word2vec 无法捕获的哪些信息 - 包括案例研究。

神经网络疯了!它们现在可以从离散分布中采样!

Neural Networks gone wild! They can sample from discrete distributions now!

了解如何使用 Gumbel 分布形成包含离散随机分量的 NN。

野外线性回归

Linear regression in the wild

当因变量有测量误差时使用线性回归。

以 SMART 方式检测异常(第二部分)

Detecting Anomalies in a SMART Way (Part Two)

关于查找异常用户的帖子系列的第二部分。